package com.example.utils;

import java.io.File;
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

/**
 *  tess4j测试类
 */

public class Tess4jDemo {
    public static void main(String []args) throws TesseractException{

        //创建ITesseract接口的实现实例对象
        ITesseract iTesseract = new Tesseract();

        iTesseract.setDatapath("C:/Users/lenovo/Desktop/OCR-demo/tessdata");

        iTesseract.setLanguage("chi_sim");
        //设置tessdata训练库语言包地址，项目根目录下为默认地址可不设置
//                iTesseract.setDatapath("E:\IDEA\IntelliJ IDEA 2019.1.3\IdeaProjects\Tess4jDemo\tessdata");
        //默认识别英文
        //如果需要识别英文之外的语种，需要指定识别语种，并且需要将对应的语言包放进项目中
//                iTesseract.setLanguage("chi_sim");

        // 指定本地图片
        File img = new File("C:/Users/lenovo/Desktop/OCR-demo/Images/test.png");
        //开始识别时间
        long startTime = System.currentTimeMillis();
        //识别结果
        String ocrResult = iTesseract.doOCR(img);
        // 输出识别结果
        System.out.println("耗时：" + (System.currentTimeMillis() - startTime) + "ms");
        System.out.println("识别结果: \n" + ocrResult );

    }
}